Lien I have been spammed by LLM crawlers - I decided to finally do something about it

Bonjour,
on me pose une question à laquelle j'ai du mal à répondre. J'ai des neveux qui passent trop de temps sur youtube, et on me demande de bloquer l'accès à ce site.
ok, bimbim, echo "www.youtube.com 127.0.0.1" >> /etc/hosts et zoooooou
bon, sauf que des fois, ils doivent aller dessus (des tutos sérieux si si). Et demander à la maman de faire la manip d'éditer des fichiers c'est compliqué (et les enfants sont pas idiots, ils vont vite (…)
Je comprends mieux, bien que je ne sois pas convaincu.
Cette nuit j'ai reçu pour la première fois un e-mail qui défendait un filtrage des contenus par une autorité administrative, je partage ici parce que ça permet de comprendre comment on peut en arriver à souhaiter cela. Pour placer le contexte, le Haut Conseil à l'Egalité « a pour mission d’assurer la concertation avec la société civile et d’animer le débat public sur les grandes orientations de la politique des (…)
Bonjour,
Avec une expression rationnelle (régulière ?), je cherche à filtrer un tant soit peu des adresses électroniques saisies dans un formulaire. Pour l'instant, je me base sur les RFC 5321 sections 4.1.2 and 4.1.3 + Errata :
email address = local-part@domain ou local-part@address-literal
local-part = (?:[a-zA-Z0-9!#$%&'*+\-/=?^_\x60{|}~]+(?:\.[a-zA-Z0-9!#$%&'*+\-/=?^_\x60{|}~]+)*)|(?:"[\x20-\x21\x23-\x5B\x5D-\x7E]*")|(?:"(?:\\[\x20-\x7E])*")
domain = (?:[A-Za-z0-9](?:[A-Za-z0-9\-]*[A-Za-z0-9])?(?:\.[A-Za-z0-9](?:[A-Za-z0-9\-]*[A-Za-z0-9])?)*(?:\.)?)
Pour address-literal, ça devient folklorique, j'ai laissé tomber après avoir tenté un truc pourri du style :
(?:\[([0-9]|([1-9][0-9])|(1[0-9][0-9])|(2[0-5][0-5]))(?:\.([0-9]|([1-9][0-9])|(1[0-9][0-9])|(2[0-5][0-5]))){3}\])|(?:\[IPv6:[0-9A-F]{1,4}(?::[0-9A-F]{1,4}){7}\])|(?:\[IPv6:(?:[0-9A-F]{1,4}(?::[0-9A-F]{1,4}){0,5})?::(?:[0-9A-F]{1,4}(?::[0-9A-F]{1,4}){0,5})?\])|(?:\[IPv6:[0-9A-F]{1,4}(?::[0-9A-F]{1,4}){5}:([0-9]|([1-9][0-9])|(1[0-9][0-9])|(2[0-5][0-5]))(?:\.([0-9]|([1-9][0-9])|(1[0-9][0-9])|(2[0-5][0-5]))){3}\])|(?:\[IPv6:(?:[0-9A-F]{1,4}(?::[0-9A-F]{1,4}){0,3})?::(?:[0-9A-F]{1,4}(?::[0-9A-F]{1,4}){0,3}:)?([0-9]|([1-9][0-9])|(1[0-9][0-9])|(2[0-5][0-5]))(?:\.([0-9]|([1-9][0-9])|(1[0-9][0-9])|(2[0-5][0-5]))){3}\])|(?:\[[A-Za-z0-9\-]*[A-Za-z0-9]:[\x21-\x5A\x5E-\x7E]+\])
Donc si je me cantonne à local-part@domain, ça donne :
/^((?:[a-zA-Z0-9!#$%&'*+\-/=?^_\x60{|}~]+(?:\.[a-zA-Z0-9!#$%&'*+\-/=?^_\x60{|}~]+)*)|(?:"[\x20-\x21\x23-\x5B\x5D-\x7E]*")|(?:"(?:\\[\x20-\x7E])*"))@(?:[A-Za-z0-9](?:[A-Za-z0-9\-]*[A-Za-z0-9])?(?:\.[A-Za-z0-9](?:[A-Za-z0-9\-]*[A-Za-z0-9])?)*(?:\.)?)$/
Je (…)
Pff, les combats, c'est jamais fini. Alors, on rigole tous sûrement un peu des abus des blocages automatiques sur YouTube. Et bien maintenant, c'est au tour des développeurs : https://juliareda.eu/2018/04/free-software-censorship-machines/
Comme j'imagine que vous êtes nombreux dans le coin, vous n'avez plus qu'à choisir votre mode d'expression. Je suppose que vous êtes contre ce changement, mais enfin, vous avez le droit d'être pour. Vous aurez juste du mal à me convaincre.
Parce que le problème de ces filtres est multiple, mais (…)
Bonjour,
Je dois installer un proxy filtrant dans une école primaire. J'utilise de puis de nombreuses année le couple Squid/squidguard (depuis 2003), et bien que cela fonctionne, ça me pose aujourd'hui un problème : en effet, Squidguard n'est plus maintenu depuis trop longtemps à mon goût…
J'ai cherché un peu, et je suis rapidement tombé sur DansGuardian (qui à l'air tellement mort que le site ne répond même plus !), et son fork e2guardian.
Y a t'il d'autres logiciels que vous (…)
La revue de presse de l'April est régulièrement éditée par les membres de l'association. Elle couvre l'actualité de la presse en ligne, liée au logiciel libre. Il s'agit donc d'une sélection d'articles de presse et non de prises de position de l'association de promotion et de défense du logiciel libre.
Bonjour forum,
Denis Szalkowski pense qu'on ne peut pas n'autoriser que firefox à sortir sur les ports 80 et 443 .
Après recherche rapide, j'ai l'impression que la meilleure solution serait de combiner une isolation en cgroup (grâce à systemd ?) et un filtrage meta cgroup grâce à nftables. Je n'ai jamais fait cela et n'ai pas le temps aujourd'hui.
Points bonus : Je soupçonne qu'une notification graphique XDG correspondant au rejet d'une connexion sortante avec des informations concernant l'application concernée (…)
DansGuardian est un logiciel de filtrage de contenu web. Il ne se contente pas d'une simple liste noire mais utilise plusieurs méthodes pour agir, comme par exemple le filtrage de mots clefs, de header HTTP, de type mime, ou plus classiquement par système de listes de domaines/urls (liste blanche, noire, etc), il a été créé et développé principalement par la société Smoothwall.
La dernière version stable 2.10.0.3 est sortit depuis un - très - long moment (2009), mais « récemment » (…)
La revue de presse de l'April est régulièrement éditée par les membres de l'association. Elle couvre l'actualité de la presse en ligne, liée au logiciel libre. Il s'agit donc d'une sélection d'articles de presse et non de prises de position de l'association de promotion et de défense du logiciel libre.